De l’informatique réactive aux opérations autonomes : Favoriser la résilience des entreprises grâce à l’automatisation pilotée par l’IA

Comment HCLTech a aidé un leader mondial de l’alimentation et des boissons à transformer des opérations informatiques fragmentées en un écosystème numérique intelligent, axé sur l’automatisation et résilient.
10 min de lecture
Partager

Aperçu

Un leader mondial de l’alimentation et des boissons, présent sur des centaines de marchés, dépend d’un vaste écosystème numérique pour stimuler la fabrication, la chaîne d’approvisionnement, la distribution et les opérations de l’entreprise. À mesure que leur empreinte numérique s’est élargie, les méthodes de surveillance traditionnelles ne pouvaient tout simplement pas suivre — ce qui ajoutait des couches de complexité et de risque.

Pour relever ces défis de front, l’organisation s’est associée à nous afin d’offrir une transformation IT Operations Management (ITOM) de nouvelle génération, fondée sur l’AIOps, dans ServiceNow. Notre objectif : mettre en place une observabilité pilotée par l’IA, standardiser les opérations et favoriser l’efficacité par l’automatisation. Le résultat ? Un passage à des opérations prédictives et autonomes à l’échelle réelle de l’entreprise.

Le défi

Systèmes hérités et observabilité fragmentée limitant l’agilité informatique

À mesure que le paysage informatique de l’organisation s’étendait à l’échelle mondiale, la visibilité opérationnelle et la coordination devenaient de plus en plus complexes, limitant la capacité à gérer les incidents de manière proactive et à maintenir la fiabilité des services.

Défi

Les principaux défis comprenaient :

  • Fonctionnalité limitée des outils de surveillance hérités, restreignant l’automatisation et les capacités d’orchestration des services
  • Manque de surveillance prédictive et de détection d’anomalies pilotée par l’IA, retardant l’identification et la résolution des incidents
  • Environnements informatiques fragmentés créant des silos de données à travers l’infrastructure, les applications et les plateformes de surveillance
  • Absence de corrélation normalisée des événements, conduisant à des alertes en double et à une augmentation du délai moyen de détection (MTTD) et du délai moyen de résolution (MTTR)
  • Données d’observabilité déconnectées entre les outils, empêchant des perspectives opérationnelles unifiées et une vision globale de la santé des services
  • Mises à jour manuelles de la CMDB et cartographie relationnelle limitée, réduisant la visibilité des services et la précision de l’identification de la cause première

Ces limitations ont augmenté la charge de travail opérationnelle, réduit la fiabilité des services et rendu difficile la mise à l’échelle efficace des opérations informatiques.

L’objectif

Transition vers des opérations informatiques prédictives et automatisées à l’échelle de l’entreprise

Pour soutenir leur stratégie numérique à long terme, l’organisation a entrepris de moderniser ses opérations informatiques.

Objectif

Les principaux objectifs comprenaient :

  • Établir une plateforme d’observabilité unifiée pour l’infrastructure, les applications et les services
  • Permettre la détection prédictive des incidents et l’identification des anomalies à l’aide de l’ propulsée par l’IA et l’apprentissage automatique
  • Mettre en œuvre la création de tickets à partir d’alertes sans intervention manuelle et des flux de travail de remédiation automatisés
  • Améliorer la visibilité opérationnelle grâce à une seule vue centralisée pour les alertes, les événements et l’état des services
  • Réduire le volume d’incidents, la charge opérationnelle et le MTTR via l’hyperautomatisation et des capacités d’auto-guérison
  • Normaliser les processus opérationnels et améliorer la gouvernance par un structuré
  • Construire un cadre opérationnel TI évolutif, prêt pour l’avenir, capable de soutenir la croissance numérique mondiale

La solution

Permettre des opérations intelligentes grâce à l’AIOps unifié et à l’automatisation

Nous avons mis en œuvre une transformation complète en tirant parti de ITOM, AIOps et de l’hyperautomatisation afin de bâtir un cadre d’exploitation TI intelligent axé sur l’observabilité. L’initiative s’est concentrée sur trois priorités clés : la standardisation opérationnelle, l’efficacité grâce à l’automatisation et l’observabilité renforcée par l’IA.

Reposant sur les principes fondamentaux de l’AIOps — observabilité unifiée, analyses basées sur l’IA, corrélation intelligente des événements et remédiation automatisée — la transformation a permis à l’organisation de progresser vers des opérations prédictives et autonomes.

Solution

Établir une observabilité unifiée à l’échelle de l’entreprise

Une plateforme centralisée d’observabilité a été implantée afin d’ingérer les événements, les métriques, les journaux et les traces provenant de plus de 75 sources de surveillance, offrant ainsi une visibilité opérationnelle en temps réel sur l’infrastructure et les applications.

La corrélation d’événements propulsée par l’IA a réduit les bruits d’alerte en groupant automatiquement les alertes liées, permettant une identification plus rapide des causes premières. ServiceNow Service Mapping a par ailleurs permis de créer des vues orientées services sur plus de 100 applications d’affaires, permettant aux équipes de comprendre les dépendances entre services et de prioriser efficacement la remédiation.

Ensemble, ces capacités ont permis de fournir une vue consolidée de la santé des services de l’entreprise, améliorant significativement la précision de la surveillance et la visibilité opérationnelle.

Favoriser l’hyperautomatisation et les opérations d’autoréparation

Ensemble, nous avons déployé un cadre d’automatisation à grande échelle alimenté par Ansible AWX et des robots d’automatisation, permettant la résolution automatisée des incidents opérationnels et la gestion de tâches d’infrastructure.

Les principales initiatives d’automatisation comprenaient :

  • Déploiement de plus de 172 cas d’utilisation d’automatisation à travers les environnements d’infrastructure et d’applications
  • Migration et optimisation de 239 playbooks dans des cadres d’automatisation Ansible
  • Couverture de l’automatisation sur plus de 20 000 serveurs et plus de 17 000 dispositifs réseau
  • Traitement automatisé d’environ 50 000 demandes par mois

Les capacités d’autoréparation ont permis la résolution proactive des problèmes récurrents dans les environnements de centres de données, réseaux et nuages, réduisant considérablement l’intervention manuelle en opérations.

Accélérer la modernisation de l’infrastructure et l’efficience opérationnelle

La transformation a aussi introduit des améliorations de l’infrastructure axées sur l’automatisation afin de renforcer la résilience et l’efficacité opérationnelle.

Les principales initiatives comprenaient :

  • Migration de la surveillance de l’infrastructure héritée vers ServiceNow à l’aide de l’Agent Client Collector sur plus de 20 000 serveurs
  • Modernisation automatisée du WAN vers SD-WAN par le biais de gabarits normalisés et d’un provisionnement automatisé
  • Automatisation intégrée de la correction de sécurité couvrant plus de 95 % des serveurs
  • Soutien automatisé pour les mises à niveau sur les plateformes iOS, Rubrik, Palo Alto et SD-WAN
  • Déploiement de plus de 100 robots d’autoréparation dans les environnements de centres de données, réseaux et nuages
  • Automatisation de la mise hors service de serveurs et dispositifs réseau, ainsi que du traitement des serveurs orphelins

Ces initiatives ont permis de réaliser d’importants gains d’efficience opérationnelle, plusieurs processus d’infrastructure atteignant une réduction d’effort de plus de 60 %.

Renforcer l’intelligence opérationnelle et l’optimisation continue

Pour maintenir la valeur à long terme, nous avons mis en place des tableaux de bord d’automatisation, des cadres de production de rapports de valeur et des mécanismes de révision continue.

Les principales capacités comprenaient :

  • Tableaux de bord sur la santé de l’observabilité et de l’automatisation
  • Rapports sur la capacité réseau avec une précision d’environ 90 %
  • Automatisation de la reprise après sinistre de l’infrastructure, améliorant le RTO et le RPO d’environ 20 %
  • Programmes d’optimisation et de maintien continus visant à accroître la performance opérationnelle

Cette démarche structurée a assuré une amélioration continue des services et une résilience opérationnelle à long terme.

La solution

L'impact

Générer des gains mesurables en efficacité, automatisation et résilience opérationnelle

La transformation a considérablement amélioré l’efficacité opérationnelle, la fiabilité des services et la maturité de l’automatisation à travers le paysage informatique mondial de l’organisation.

Impact

Résolution plus rapide des incidents et réduction de la charge de travail opérationnelle

L’automatisation et la remédiation pilotée par l’IA ont considérablement accéléré la réponse et la résolution des incidents dans les environnements informatiques.

  • Réduction de 70 % du temps moyen de résolution (MTTR) grâce à la détection prédictive et à la remédiation automatisée
  • 50 000 billets traités automatiquement par mois, réduisant considérablement la charge de travail du centre de services
  • Taux de résolution automatisée d'environ 30 % sur le volume total d'incidents
    • Réduction d'environ 90 % du bruit événementiel et des alertes grâce à la corrélation alimentée par l’IA/ML de ServiceNow, améliorant significativement l’efficacité opérationnelle

Ces améliorations ont réduit l’intervention manuelle tout en permettant une reprise de service plus rapide et plus cohérente.

Gains de productivité significatifs grâce à l’automatisation à grande échelle

Les cadres d’automatisation et les flux de travail pilotés par des robots ont permis d’importantes améliorations de l’efficacité opérationnelle dans les opérations d’infrastructure et de services.

  • 43 000 heures d'effort économisées par mois grâce à l'efficacité opérationnelle induite par l'automatisation
  • 35 000 heures mensuelles économisées grâce à des flux de travail et des cadres d’automatisation pilotés par BOTS
  • ~45 % de potentiel d'automatisation identifié, dont 17 % réalisés dès la première année

Cela a permis aux équipes de concentrer leurs efforts sur des initiatives stratégiques à plus forte valeur ajoutée plutôt que sur des tâches opérationnelles répétitives.

Extension de la couverture d’automatisation à l’infrastructure d’entreprise

La transformation a déployé l’automatisation à l’échelle des couches d’infrastructure critiques, améliorant la cohérence et la fiabilité opérationnelles.

  • Taux de réussite de l’automatisation de 90 %, démontrant une grande fiabilité des flux automatisés
  • 90 + cas d’utilisation d’automatisation Ansible déployés dans les opérations d’infrastructure
  • Résolution par BOT d’environ 67 % des billets dans les environnements de centres de données, de réseau et de nuage
  • 100 + robots d’auto-guérison déployés dans les environnements d’infrastructure

Ces capacités ont permis une résolution plus rapide des problèmes tout en renforçant la stabilité de l’infrastructure.

Gouvernance de service et visibilité organisationnelle améliorées

La mise en place d’un cadre unifié d’observabilité et de gouvernance de services a amélioré la transparence opérationnelle et la collaboration entre les équipes mondiales.

  • Vue unifiée (« single pane of glass ») pour l’observabilité et la surveillance d’entreprise
  • Plateforme centralisée de gestion des services alignée sur les meilleures pratiques du secteur
  • Coordination renforcée entre les opérations, les partenaires stratégiques, les fonctions mondiales et les équipes sectorielles
  • Cadres de rapport enrichis pour les données d’observabilité, la performance de l’automatisation et la santé opérationnelle

Ce modèle de gouvernance a renforcé le contrôle opérationnel tout en améliorant la visibilité sur la performance des services de l’entreprise.

Optimisation opérationnelle soutenue et création de valeur à long terme

La surveillance continue, la production de rapports de valeur et les programmes d’optimisation assurent des améliorations continues de la performance et une maturité opérationnelle à long terme.

  • Surveillance de la santé de l’automatisation et tableaux de bord d’observabilité pour le suivi en continu des performances
  • Initiatives d’amélioration continue et d’optimisation dans l’ensemble des opérations informatiques
  • Modèle structuré de pérennisation soutenant l’évolution à long terme et la résilience opérationnelle

Ensemble, ces améliorations ont permis d’établir un cadre opérationnel informatique évolutif centré sur l’automatisation, apte à soutenir la croissance numérique mondiale de l’organisation.

Conclusion

Cette transformation reflète l’engagement de l’organisation à bâtir un écosystème d’opérations TI résilient, évolutif et intelligent, aligné sur ses ambitions numériques mondiales. En combinant la vision stratégique de l’organisation avec notre expertise, ce partenariat a permis de redéfinir avec succès la prestation des services TI d’entreprise.

Grâce à cette transformation, l’organisation bénéficie maintenant d’une résolution plus rapide des problèmes, d’une transparence opérationnelle accrue ainsi que d’un cadre d’exploitation évolutif capable de soutenir l’innovation numérique continue et la croissance de l’entreprise.

DFS Gestion unifiée des services Étude de cas De l’informatique réactive aux opérations autonomes : Favoriser la résilience des entreprises grâce à l’automatisation pilotée par l’IA